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Verfahren zutn evolutiven Design und Synthese funktionaler 
Polvmere auf der Basis von Formenelementen und Formencodes 

Gegenstand der vorliegenden Erf indung ist ein Verfahren gemaS 
Anspruch 1 . 

Die rasante Entwicklung der letzten Jahre im Bereich der Bio- 
wissenschaf ten hat nicht nur die Grundlagenf orschung, sondern 
gerade auch die angewandte Forschung in diesem Feld stimu- 
liert . Proteine spielen hier aufgrund ihres breiten Wirkungs- 
spektrums eine herausragende Rolle. Ein ganzer Zweig der 
modernen Biotechnologie beschaftigt sich heute mit dem sog. 
"Protein Engineering", d.h. der Herstellung von Designer- 
Proteinen, die entweder auf der Grundlage bekannter Proteine 
durch graduelles Abandem oder durch vollstandige Neusynthese 
entwickelt werden. Man unterscheidet hier vor allem zwei 
Ansatze, das rationale und das irrationale Design. 

Rationales Design ist darauf axis, eine Aminosauresequenz zu 
produzieren, die sich in eine gewiinschte Struktur faltet, 
und zusatzlich die erhoffte Funktion auf weist . Damit hangt 
diese Strategie ganz of f ensichtlich von einem tiefen Ver- 
standnis des "Protein folding" ab. Fortschritte in den 
letzten Jahren betrafen u.a. das rationale Design einfacher 
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Struktur-Domanen. Das Design groSerer Proteins mit komplexen 
Oder gar beispiellos neuen Eigenschaf ten liegt jedoch immer 
noch auEerhalb der Moglichkeiten dieses Ansatzes. Dem- 
gegeniiber setzt irrationales Design keine Inf ormationen uber 
die Proteins truktur, Proteinf altung etc. voraus. Einzig die 
Kenntnis der gewiinschten Eigenschaf t und eine Moglichkeit, 
Molekiilpopulationen gemessen an dieser Eigenschaft zu be- 
werten, sind hier Voraussetzung . Ausgehend von einer "com- 
binatorial library" aus Peptiden oder Proteinen werden 
Molekiile mit der gewunschten Eigenschaft selektiert und erst 
im Nachhinein analysiert . Hier wird also der Mechanismus, 
nachdem ein Molekiil die gestellte Aufgabe meiste'rt, nicht 
im voraus determiniert • 

Obwohl dieser Ansatz in sehr eleganter Weise gerade auch in 
jiingster Zeit Peptide mit einfachen und z. T. neuen Eigen- 
schaf ten heirvorgebracht hat, stellt sich auch hier das 
Problem, wie man zu groSeren Proteinen mit komplexeren 
Funktionen kommen kann. Schon eine vollstandige Bank eines 
20mers liefert mit 20^^ = 10^^ verschiedenen Sequenzen eine 
astronomisch hohe Zahl zu untersuchender Molekule. Soli die 
Peptidsequenz auch noch durch eine Nucleinsaure codiert 
werden, stellt sich das Problem in noch gravierender Weise. 
Da der genetische Code degeneriert ist, d.h. eine Aminosaure 
u.U. durch mehrere verschiedene Codons reprasentiert wird, 
ergibt sich hier eine Zahl von mindestens 4^° = 10^^ Mole- 
kiilen, die synthetisiert werden. Normalerweise wird an der 
dritten Codonposition nur G oder C zugelassen, um Stopcodons 
weitgehend zu vermeiden. Die verbleibende Zahl von 10^° 
Molekulen iibersteigt noch immer die Standardausbeute einer 
kommerziellen DNA-Synthese um 12 GroEenordnungen . Eine 
weitere Reduktion der pro Position zugelassenen Codons wurde 
von Youvan vorgeschlagen . Ob diese Methode den mefibaren Se- 
quenzraum nicht in unzulanglicher Weise einschrankt, gerade 
bei der Suche nach neuen Funktionen, bleibt abzuwarten. 
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Zum Aufbau funktionaler Strukturen arbeitet die Natur mit 
modularen Systemen. Bekannt sind die Nucleotidbaus.teine , die 
Aminosaure-Bausteine (als Nucleotidtripletts kodiert) und 
Exon-Domanen (aus Aminosaurebausteinen aufgebaut) . Die evo- 
lutive Optimierung funktionaler Biopolymere entsprechend der 
Patentanmeldung WO 92/18645 geht von der Vorstellung aus, 
durch kontinuierliche Verbesserung bestehender Basiseigen- 
schaften, z. B. eines Enzyms, bei der kontinuierlichen 
Anpassung an erwunschte Reaktionsbedingungen wie lonenstarke, 
Temperatur, pH-Wert eine optimale Struktur zu finden. Sind 
vorteilhafte oder mindestens neutrale Mutationen moglich, 
so sind durch mehrraalige Wiederholungen von Selektion und 
Mutation auch entfernte Bereiche des Seguenzraumes zugang- 
lich, die durch die Ausgangspopulation nicht abgedeckt waren. 
Von der urspriinglichen, bereits f unktionsf ahigen Struktur 
entfernt man sich jedoch bei diesem Vorgehen in keinem 
Schritt. Optimiert wird eine Eigenschaft des Aus- 
gangsmolekiils , die bereits - wenn auch in bescheidenem MaSe 
- im urspriinglichen Molekiil inharent ist, Der "Pfad", den 
eine solche Evolution durch den Sequenzraum nimmt, ist 
bestimmt durch die zuganglichen, in Richtung der Optima 
fiihrenden Grate in der unterliegenden Wertelandschaf t . Wie 
bei alien Methoden, die den Sequenzraum nicht vollstandig 
erschlieSen, besteht bei diesem Vorgehen die nur schwer 
einzuschatzende Gefahr, in einem lokalen Optimum stecken- 
zubleiben. Fur die Praxis bedeutet dies, daS bestimmte 
Regionen des Seguenzraumes einschlieSlich der dort befind- 
lichen Optima, durch breite und tiefe "Taler" abgetrennt 
sind. Bei der begrenzten PopulationsgroSe von Molekulspezies 
in Experimenten (P 43 22 147, WO 92/18645) ist aber die Wahr- 
scheinlichkeit zu niedrig, entfernte Vielf ehlermutanten zu 
erzeugen, die sich jenseits dieser Schranke befinden und den 
Weg 2U diesen neuen Optima anzeigen. 

Die Natur hat eine Anzahl von Mechanismen entwickelt, mit 
dieser Problematik umzugehen: lange Entwicklungszeitraume , 
Rekombinationsverf ahren (horizontaler Gentransfer, Crossing- 
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over, Genkonversion, Exon-Rekombination (exon-shuf fling) , 
Virusshuttles, mobile Elemente (Transposons) , Untereinheiten- 
Struktur von komplexen Proteinen) ) sowie Multigenf amilien 
mit Pseudogenen. 

Mit der Anzahl der parallel gefiihrten Mut ant enbil dung und 
Selektion laSt sich die Chance auf Erzeugung einer ge- 
wunschten Vielf ehlermutante erhohen; durch Rekombination 
lassen sich mutierte Gensegmente effizient mischen, 
Funktionslose Pseudogene als Mitglieder einer funktions- 
fahigen Multigenf amilie lassen sich als Vielf ehlermutanten 
auch liber langere Entwicklungszeitraume ohne Gegenselektion 
in ihrer Existenz erhalten, um eventuell bei Ruckerhaltung 
einer Funktion wieder positiv selektierbar zu werden. 

Die Ubertragung dieser Mechanismen auf eine effiziente in 
vitro Optimierung ist of f ensichtlich nicht ohne weiteres 
moglich. Die Schwierigkeiten tniissen jedoch in jedem Falle 
fur solche Auf gabenstellungen gelost werden, bei denen eine 
kontinuierliche Optimierung nicht erwartet werden kann. Dies 
trifft insbesondere fiir solche Anpassungsprozesse zu, bei 
denen eine Funktion vollstandig neu etabliert werden mufi. 

Das der Erfindung zugrundeliegende technische Problem be- 
trifft die Bereitstellung eines Verfahrens zur Herstellung 
oligomerer oder polymerer Funktionselemente wie Biopolymere 
mit funktionalen Eigenschaf ten, beispielsweise Enzymen, 
Ribozymen, Wirkstoffen, etc. Dabei soil unter Ausnutzung 
evolutiver Strategien ein den herkommlichen Screening-Ver- 
fahren liberlegenes Verfahren bereitgestellt werden. 

Gelost wird dieses Problem durch ein Verfahren mit den 
Merkmalen des Anspruchs 1. Die sich daran anschlieSenden 
Unteranspriiche betreffen bevorzugte Ausf uhrungsf ormen des 
erf indungsgemaSen Verfahrens. 
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Erf indungsgemaS werden zur Herstellung oligomerer oder 
polymerer Funktionselemente aus Formenelementen zunachst 
Formenelemente durch chemische oder enzymatische Verknupfung 
von mindestens zwei Monomeren aufgebaut und die so erhalt- 
lichen Formenelemente dann zu Funktionselementen verkniipf t . 
Dabei entspricht die Natur der chemischen Bindung zwischen 
den Monomeren derjenigen zwischen den jeweiligen Formen- 
elementen. Die so erhaltlichen Funktionselemente konnen dann 
auf die bestimmten potentiellen Funktionen getestet werden. 
Die Vorteile der erf indungsgemaSen Vorgehensweise werden 
durch die nachfolgende Beschreibung weiter verdeutlicht - 

Bevorzugt wird die Verknupfung der Formenelemente unter 
Einsatz einer f esten Phase als Reaktionstrager durchgef uhrt . 
Die Verknupfung der Formenelemente kann chemisch und/oder 
enzymatisch erfolgen. Die Verknupfung der Formenelemente zu 
den Funktionselementen kann entweder planmaSig durch gezielte 
Zugabe der einzelnen Formenelemente und nachf olgender Ver- 
knupfung Oder auch statistisch durch zufallig gesteuerte 
Zugabe der Funktionselemente und deren Verknupfung erfolgen. 
Es ist dabei moglich, die Verknupfung schrittweise aufbauend 
stereospezif isch und/oder gerichtet durchzuf uhren . 

Als Formenelemente kommen vorzugsweise Nucleinsauren, doppel- 
strangige oder einzelstrangige DNA und/oder RNA und/oder 
modifizierte Nucleinsauren in Frage . Als Formenelemente 
kommen auch Peptide und/oder Polypeptide und/oder sonstige 
kopplungsf ahige chemische Oligomer -Formenelemente in Frage . 
Dazu konnen auch Oligo- oder Polysaccharide gehoren. 

In einer bevorzugten Ausf iihrungsf orm des erf indungsgemaSen 
Verfahrens werden die Formenelemente als bereits syntheti- 
sierte Oligomerbausteine eingesetzt oder im Reaktionsgef afi 
quasi in situ hergestellt. 

Es ist vorteilhaft, die Reaktion der Formenelemente in 
parallel gefuhrten Mikroreaktionsansatzen (wie in P 43 22 
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147.5 vorgeschlagen) durchzuf uhren, bei denen die Formen- 
elemente in vorbestimmter Reihenfolge verknupft werden. 
Insbesondere werden nach erfolgter Synthase die Reaktions- 
produkte wie Funktionselemente oder Vorstufen davon an der 
fasten Phase gebunden bleiben und nach Abtrennung der 
Reaktionspartner waiter verarbeitet oder von der Festphase 
entkoppelt. Es ist jedoch ebenfalls moglich, die Reaktion 
in geeigneten, dam Fachmann bekannten Reaktionsbadingungen 
in Losung durchzuf iihren oder die f estphasengekoppelte oder 
in homogener Losung durchgefiihrte Reaktion miteinander zu 
kombinieren. 

Durch Einsatz der Fluoreszenzkorrelationsspektroskopie (FCS) 
(PCT/EP 93/01291) wird es ermoglicht, die Funktionsweise der 
Funktionselemente im gleichen Volumenelement direkt zu 
bewerten, in dem auch die Synthese ablauf t . Dies bedeutet 
eine sehr direkte Moglichkeit, das Ergebnis einer aufbauenden 
Funkt ions element synthese zu kontrollieren. 

Vorzugsweise wird pro Reaktionsschritt , bei der schrittweisen 
Verknupfung der Formenelement , jeweils ein Formenelement als 
Reaktionspartner an fester Phase gekoppelt. Es konnen auch 
Mischungen von Formenelementen eingesetzt werden und/oder 
im Reaktionsgef alS direkt generiert werden. Werden als Formen- 
elemente Nucleinsauren verwendet, so ist es vorteilhaft, 
wanigstens einen Reaktionspartner mit einer Schnittstalle 
eines Restriktionsenzym zu versehen oder ein Nucleinsaure- 
formenelement zu verwenden, welches frei von Start- und/oder 
Stopcodons ist . Vorzugsweise sind die Reaktionsschnittstellen 
solche, die von Restriktionsenzymen der Klasse IIS erkannt 
werden konnen. Die Einfiihrung von Restriktionsschnittstellen 
dieser Enzymklasse ist vorteilhaft, da beliebige Seguenzen 
gerichtet verknupft werden konnen, ohne daS die Wahl des 
Reaktionsenzyms die Sequenzerf ordernisse des Endproduktes 
beeinf luSt . 
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Sind in den zu verknupf enden Formenelemente einzelstrangige 
Uberhange eingefiihrt, so konnen dariiber beliebige. Sequenzen 
gerichtet verknupf t werden, ohne daS dabei irgendwelche 
Anf orderungen an die Seguenz des gewunschten Endproduktes 
gestellt werden mussen. Dieses Erfordernis kann auch durch 
selektive und reversible chemische und/oder enzymatische 
Modifkation der 3'- und/oder 5 '-Enden der Nucleinsauren, zum 
Beispiel durch Phosphorylierung ans telle und in Kombination 
mit der Einfiihrung der einzelstrangigen Uberhange erzielt 
we r den . 

Als Beispiel fur eine reversible chemische Modif ikation ist 
das Ankoppeln einer Trityl-Schutzgruppe, die durch Behandlung 
mit Essigsaure abspaltbar ist, zu nennen. Die Einfiihrung 
der Tritylgruppe am 3 ' - oder 5'-Ende des Nucleotids fiihrt 
zur Blockade der Ligation der Formen- und/oder Funktionscodes 
bzw. -elemente. 

Durch Behandlung eines Oligo- oder Polynucleotids mit 
Nuclease kann ein 3'- oder 5'-Ende modif iziert werden, zum 
Beispiel wird durch Behandlung mit Exonuclease III das 3'- 
Ende durch Abdauung modif iziert- Wenn in das entsprechende 
Oligo- oder Polynucleotid (z. B, DNA) Nucleotidtriphosphate 
eingebaut werden, so stoppt die Exonuclease am erst en Thio- 
Nucleotid die Abdauung. Damit ergibt sich eine regulierbare 
Modif izierung des Endes des Oligo- oder Polynucleotids. 

Das erf indungsgemaSe Verfahren erlaubt den Einsatz von 
Formenelementen, die nach rontgen-kristallographisch analy- 
sierten naturlichen Funktionsdomanen von Proteinen und 
Polypeptiden bekannt sind. Es konnen so bereits bekannte 
Bausteine bzw. Module von in der Natur bereits vorkommenden 
Funktionselementen benutzt werden. 

Die zu verwendenden Formenelemente konnen auch aus 
Selektionsexperimenten gewonnen werden. 
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Insbesondere vorteilhaft ist die Verv/endung von Formenelemen- 
ten in einer Lange von 1 bis 60 Aminosauren oder Nucleotid- 
sequenzen entsprechender Kodierungslange . Die Formenelemente 
konnen auch an bestimmten Positionen degeneriert sein 
und/oder Deletionen oder Insert ionen tragen, insbesondere 
bei Verwendung von Nucleotiden als Formenelemente. 

Es wird auch die Verwendung des erf indungsgemaSen Verfahrens 
wie oben beschrieben zur Synthese parallel aufgebauter 
Formen-Bibliotheken funktionaler Oligomere oder Polymere 
beansprucht . 

Die urspriingliche Aufgabe von "combinatorial libraries" ist 
eher das Angebot einer Funktionen-Vielf alt als einer Sequenz- 
vielfalt. Es ist heute eine Tatsache, daS die drei- 
dimensionale Struktur von Proteinen relativ stabil gegen 
Substitutionen einzelner Aminosauren ist. Durch die groEe 
Zahl aufgeklarter Proteinstrukturen gewann man die Er- 
kenntnis, daB Proteine zwar keine oder nur sehr geringe 
Sequenzhomologie aufweisen konnen, aber trotzdem die gleiche 
oder sehr ahnliche 3D- Struktur einnehmen konnen. Dies bemht 
moglicherweise darauf, daS nur eine begrenzte Anzahl mog- 
licher Faltungsweisen von Aminosaureketten unter biologischen 
Bedingungen stabil ist. Strukturelle Verwandtschaft spiegelt 
aber auch die Evolution rezenter Proteine aus einer relativ 
begrenzten Zahl von Ur-Strukturen, -Modulen heraus wieder. 
Diese Module konnen als kleine, funktionelle Domanen oder 
kompakte Struktureinheiten verstanden werden und konnen auch 
in heutigen Genen leicht aufgespurt werden. In der Hypothese 
des "Exon-shuf fling" wird vermutet, daiS die Evolution zu 
komplexeren Proteinen gerade durch die Kombination von Exons, 
also Modulen im oben beschriebenen Sinn enorm beschleunigt 
wurde. Wenn man annimmt, daS die Zahl der Exons, die die 
Konstruktion aller heute bekannten Proteine erlauben wiirde, 
zwischen 1000 und 7000 zu suchen ist, eroffnet eine hier- 
archische Strategie des "Protein Design" mit Bausteinen 
zunehmender Komplexitat die Moglichkeit der viel schnelleren 
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Durchmessung eines "shape space" mit zugehorigerer "fitness 
landscape" als es die Suche in einer traditionellen 
"combinatorial library" gestatten wiirde . Ein Protein aus 
150 Aminosauren (die GroSe einer klassischen Nucleotide 
bindungsstelle, der sog. "Rossman fold") muSte nach herkomm- 
lichem Verfahren aus einer Bibliothek von 2 0^^° = 10^^^ ver- 
schiedenen Aminosauresequenzen selektiert werden. Kombi- 
nationen von 1000 verschiedenen Modulen der Lange 3 0 Amino- 
sauren ergeben hingegen nur eine Komplexitat von 1000^ = 10^=* 
Molekulen. 

Das erf indungsgemaSe Verfahren ist ein hierarchisches Ver- 
fahren zum Design von Proteinen, Nucleinsauren deren 
Derivaten oder chemischer Oligo- oder Polymere mit bestimmten 
gewunschten Eigenschaf ten, ausgehend von Modul-Bibliotheken, 
im folgenden als Formenelemente bezeichnet. Erf indungsgemafi 
konnen die Formenelemente auch Gensegmente sein, die fiir 
Formenelemente kodieren. Die als Module fungierenden Formen- 
elemente sollen zufallig kombinierbar sein. Kleinere Proteine 
Oder Untereinheiten fur groSere Proteine mit bestimmten 
Eigenschaf ten werden in einem anschliefienden Selektions- 
schritt aus dem Pool von Modulkombinationen herausgesondert 
und konnen ihrerseits wieder als Bausteine in einer Unterein- 
heits-Bibliothek dienen, u.s.w. 

Auf jeder Konstruktionsstuf e kann durch fehlerhafte Kopierung 
einzelner Bausteine zusatzlich ein "Rauschen" auf Aminosaure- 
sequenzebene eingefuhrt werden. Dies ermoglicht die Modu- 
lierung der dreidimensionalen Anordnung chemischer Gruppen 
und somit eine weitere funktionelle Optimierung selektierter 
Molekiile. Die vorgeschlagene Strategie erfordert eine neue 
Art von "Artificial Gene Assembly" . 

Bisher werden vor allem zwei Methoden angewandt, denen 
gemeinsam ist, dafi die DNA in einer bestimmten Orientierung 
ligiert wird, um damit auch die Abfolge der Aminosauren 
festzulegen. Die wohl alteste Methode - von Khorana und 
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seinen Mitarbeitern entwickelt - arbeitet mit iiberlappend 
komplementaren einzelstrangigen DNA Molekiilen, die vor.der 
Ligation miteinander hybridisiert werden. Die zweite Methode 
nutzt Schnittstellen von Restrikt ionsenzymen im zu 
konstruierenden Gen, urn an diesen Stellen das Gen in Blocke 
zu unterteilen, die dann in mehreren auf einanderf olgenden 
Schritten zusammengesetzt werden. Durch beide Methoden wird 
die Sequenz an den Ubergangen der verwendeten Oligo-DNAs bzw. 
Blocke methodisch bedingt festgelegt. Dies aber entspricht 
gerade nicht der Anf orderung nach beliebiger Austauschbarkeit 
der einzelnen Module schon in der Konstruktionsphase des 
Gens. Bestandteil der vorliegenden Erfindung ist also not- 
wendigerweise auch eine neue Art des "Artificial Gene 
Assembly" . Erf indungsgemaS wird in allgemeiner Form wie f olgt 
verf ahren: 

Das Verfahren des "Artificial Gene Assembly" arbeitet 
analog des in der WO 92/18645 beschriebenen Verfahrens; 

das Verfahren erschliefit nicht den Umgang mit der 
Varianz im Sequenzraum sondern mit der Varianz im 
sogenannten Formenraum. Der Formenraum, gebildet aus 
Basiselementen def inierter stabiler Formenelemente , 
reduziert die Komplexitat der Varianten der Bauelemente 
des Sequenzraumes ; 

das Verfahren erschlieSt den Funktionsraum liber eine 
Variation von Bausteinen des Formenraumes ; 

als Bausteine werden Bausteine des Form-Codes (siehe 
unten) eingesetzt ; 

fur die Auswahl der Bausteine werden bestimmte Aus- 
wahlkriterien zur Vorselektion eingesetzt, die 
theoretischen Annahmen entsprechen oder natiirlichen 
Formen-Analoga entsprechen , 
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Als Module zur parallel gefiihrten Variation (Mutation) und 
Selektion stehen bislang nur die Nucleotide oder Aminosauren 
als synthetisch oder enzymatisch handhabbare Bausteine eines 
Polymers fiir gerichtete Kopplungsprozesse zur Verfiigung. 
Der direkte Zugang zu einer funktionalen Oberf lachenstruktur 
eines Polymers scheitert wie oben angefiihrt in vielen Fallen 
am Problem der groSen Zahlen der Varianten des Sequenzraumes . 

Gegenstand dieses evolutiven Anpassungsprozesses ist der 
Einsatz modularer Bausteine, dem Formencode, bestehend aus 
den Formenelementen, Der Formencode umfafit Formenelemente , 
aufgebaut aus Elementen des Sequenzraumes. Der Formencode, 
wie er beispielsweise aus naturlichen Polymeren wie 
Proteinen, Polypeptiden oder funktionalen Nucleinsauren 
abgeleitet werden kann, kodiert unter f estgesetzten auBeren 
Bedingungen stabile Formenelemente (Sekundarstrukturen, 
eventuell Tertiarstrukturelemente enthaltend) . Dabei ist 
bemerkenswert , daS sehr unterschiedliche Sequenzen (Primar- 
strukturen) fur sehr ahnliche Formenelemente kodieren konnen. 
Mit anderen Worten, im Formenraum sehr eng benachbarte 
Elemente konnen im Sequenzraum sehr weit voneinander entf ernt 
liegen (grofie Hamming Distanz) . Das gleiche gilt fiir den 
umgekehrten Fall . Im erf indungsgemaSen Sinne erklart eben 
diese Eigenschaft, dafi bereits der Austausch formenmaSig 
gleicher Sequenzen im Sequenzraum einen gro&en Schritt im 
Sinne einer Vielf ehlermutante bedeuten kann. Mit Hilfe der 
erf indungsgemaSen angesprochenen Syntheseverf ahren ist diese 
Anforderung technisch umsetzbar. Die Erstellung der ent- 
sprechenden Verteilungen gelingt durch programmierte 
Synthese. Sie ist nicht, wie in WO 92/18645 beschrieben, 
durch fehlerhafte Replikation im Sinne f ehlerbehaf teter 
PGR- Verf ahren zu erreichen. 

Bei der linearen Kombination von Formencodes konnen hetereo- 
loge wie auch zumindest teilweise homologe Formencodes 
verwendet werden, die genotypisch durch einen Formencode 
naturlichen oder kiinstlichen Ursprungs definiert werden. 
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Unter natiirlichem Ursprung wird erf indungsgemalS verstanden, 
daS auf schon vorhandene genetische Inf ormationen. zuruckge- 
griffen wird, wie sie beispielsweise im Genom von Organismen 
niedergelegt ist. Unter Formcodes kunstlichen Ursprungs wird 
auf Nucleinsaureebene erf indungsgemaS insbesondere ver- 
standen, daS Sequenzen durch Algorithmen mittels Datenver- 
arbeitungsanlagen generiert warden konnen, urn anschlieSend 
nach diesen Anweisungen chemisch synthetisiert zu werden. 
SchlieElich ist auch eine Herstellung durch de novo-Synthese 
moglich, indem Polymerasen mit den dazugehorigen Substraten 
wie Nucleotiden umgesetzt werden. Dabei kann die Polymerase- 
reaktion matrizenabhangig oder -unabhangig durchgefiihrt 
werden . 

Die Formenelemente und Funktionselemente , wie sie gemaS der 
Erf indung insbesondere verstanden werden, sind beispielsweise 
in Proteinen oder Peptiden als Phanotypen auffaSbar. Die 
entsprechenden Genotypen, beispielsweise auf Nucleinsaure- 
ebene, sind dazu die entsprechenden Formen- und Funkt ions- 
codes. Bleibt man zum Beispiel auf der Nucleinsaureebene so 
wird der "Phanotyp" mit Funkt ionselementen und/oder Formen- 
elementen, zum Beispiel durch ein Ribozym verkorpert, welches 
genotypisch in einer Nucleinsaureseguenz als Formencode 
und/oder Funkt ionscode entsprechend reflektiert wird. Dies 
bedeutet, daS erf indungsgemaS die Begriffe Funktions- /Formen- 
element (Phanotyp) stets quasi als komplementar mit dem 
Begriff Funktions -/Formencode (Genotyp) verstanden werden. 

Die Formenelemente und/oder Funkt ionselemente bzw. Formen- 
codes und/oder Funkt ionscodes konnen, sofern sie Nuclein- 
sauren sind, durch verschiedene Verfahren gewonnen werden, 
wie dies weiter oben angegebenen ist, namlich durch Riickgriff 
auf schon bekannte Nucleinsauresequenzen, durch Generierung 
kiinstlicher Sequenzen in Datenverarbeitungsanlagen oder durch 
de novo-Synthese. 
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Die Figur 8 erlautert die Begriff Sequenzraum, Formenraum 
und Funktionsraum, Analog der betrachteten Beziehung von 
Formenraum und Sequenzraum gilt fur die Beziehung von Formen- 
raum und Funktionsraum, daS eng benachbarte, homologe Ele- 
mente im Formenraum im Funktionsraum weit voneinander ent- 
fernt sein konnen. Wie in Figur 8 schematisch angedeutet, 
ist fiir die Funktion eines Polymers die Geometrie und die 
physicochemische Topologie und Dynamik der Molekiiloberf lache 
maBgebend, die mit einem zweiten Molekul in Wechselwirkung 
tritt . Die darunterliegende Struktur, definiert aus dem 
Formencode, konnte sehr unterschiedlicher chemischer Natur 
sein. Ahnliche Funktionen im Funktionenraum erklaren sich 
durch ahnliche Grenzf lachen-Topologien . 

Gerade im Hinblick auf die in Experimenten realisierbaren 
relativ kleinen Molekulpopulationen, ist es von ent- 
scheidender Bedeutung, daS die erzeugte Variation im Formen- 
raum in viel ef f izienterer Weise als etwa die Variation im 
Sequenzraum die mogliche Funktionenvielf alt im Funktionsraum 
reprasentiert . 

Die folgenden Figurenbeschreibungen erlautern an Beispielen 
schematisch die Erfindung naher. 

Die Figur 1 betrifft zwei einzelstrangige DNA bzw. RNA- 
Molekiile, die chemisch Oder enzymatisch (z.B. T4 RNA Ligase) 
ligiert werden, wobei eines der Molekule liber einen spalt- 
baren Linker (z.B. Biotin-Streptavidin) an fester Phase 
immobilisiert ist, wahrend das andere Molekul frei in Losung 
vorliegt . 

Es stehen dazu heute eine ganze Reihe von Festphasen- 
materialien (z.B. magnetische, oberflachenaktivierte Kunst- 
stoffkugeln) zur Verfugung. Dieses Verfahren gestattet den 
schrittweisen Aufbau von groSeren DNAs bzw. RNAs . Nach jedem 
Ligationsschritt werden nicht umgesetzte RNAs weggewaschen 
und die an fester Phase befindlichen Ligationsprodukte in 
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den nachsten Ligationsansatz transf eriert . Vorteilhaf terweise 
ist die Handhabung, insbesondere die Reinigung der . jeweiligen 
Ligationsprodukte sehr einfach. 

Nach Abschlufi der letzten Ligation wird das Produkt direkt 
als Ef f ektormolekul eingesetzt oder in einer (in vitro) 
Translationsreaktion zunachst in die entsprechende Protein- 
struktur ubersetzt, welche dann als Eff ektormolekul fungiert. 

Die Figur 2 betrifft zwei vollstandig doppelstrangige DNA- 
Molekiile, die chemisch oder enzymatisch (z.B. T4 DNA Ligase) 
"blunt end" ligiert werden, wobei eines liber einen spaltbaren 
Linker an fester Phase immobilisiert ist, wahrend das andere 
f rei in Losung vorliegt . Auf diese Weise konnen schrittweise 
gr615ere doppelstrangige DNA Molekule aufgebaut werden. Die 
gerichtete Ligation wird durch unterschiedliche Phosphory- 
lierung der Reaktionspartner erreicht. Modul A und das letzte 
Modul sind so entworfen, daS sie jeweils eine Schnittstelle 
fiir ein Restriktionsenzym enthalten. Dies ermoglicht erstens 
die Abspaltung des Produktes von der festen Phase und zweit- 
ens die anschliefiende , gerichtete Klonierung der DNA {siehe 
auch Figur 5) . 

Zu Figur 3 : DNA-Molekiile konnen gemaS Figur 2 ebenfalls 
ligiert werden, wenn das in Losung befindliche Molekul an 
einer Seite ein einzelstrangiges Ende besitzt, d.h. nicht 
vollstandig doppelstrangig vorliegt. Dieses Ende steht auf 
diese Weise nicht fur die Doppelstrang-spezif ische Ligation, 
z.B. mit T4 DNA Ligase zur Verfiigung. In Kombination mit den 
schon erwahnten Phosphorylierungsstrategien (Figur 2, insbe- 
sondere Variante 1) ergibt sich die Moglichkeit, die Ligation 
ohne unerwiinschte Nebenprodukte durchzuf uhren. Das in Losung 
befindliche DNA-Molekul kann so entworfen sein, daS es vor 
seinem einzelstrangigen Ende noch die Schnittstelle eines 
Resnriktionsenzyms vorzugsweise die eines Class IIS Enzyms 
(z.B. Alwl) mit Erkennungsstelle in dem abzuschneidenden, 
teilweise einzelstrangigen DNA-Stiick) besitzt. Nach der 
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Ligation kann das Ligationsprodukt an fester Phase mit dem 
Restriktionsenzym geschnitten werden. Auf diese Weise 
entsteht wieder ein vollstandig doppelstrangiges DNA-Molekul 
an fester Phase, Alternativ kann das einzelstrangige Ende 
mit einer Polymerase zum Doppelstrang aufgefullt oder mit 
einer Exonuclease abverdaut werden. 

Zu Figur 4 : Restriktionsschnittstellen konnen (iiberlappend) 
auch entstehen, indem zwei doppelstrangige DNA-Molekule 
miteinander ligiert werden. 

Zu Figur 5 : Vollstandig oder teilweise doppelstrangige 
DNA-Molekule konnen gemaS Figuren 1-4 ligiert werden, auch 
wenn Mischungen von Molekiilen (z, B. B, C, D) verwendet 
werden. Auf diese Weise entstehen Mischungen von immobi- 
lisierten Molekiilen, die jeweils verschiedenen Kombinationen. 
der eingesetzten Bausteine entsprechen. Am Ende des letzten 
Ligationsschrittes kann die Gesamt-DNA oder ein Teil davon 
mit Hilfe von Restriktionsenzymen, die innerhalb des Kon- 
struktes schneiden, von der festen Phase abgespalten und ggf . 
in ein Phagen- oder Bakteriendisplay- System kloniert werden. 
die DNA kann aber auch in einem kombinierten in vitro Trans - 
kriptions- und Translationssystem exprimiert werden. 

Zu Figur 6: Ausgehend von Modul-Bibliotheken konnen Peptide, 
Proteindomanen und kleine Proteine durch zufallige Kom- 
bination von einzelnen Modulen erzeugt werden. Entsprechend 
einem hierarchischen Verfahren zum Proteindesign konnen in 
einer weiteren Stufe dann auch Proteindomanen als Bausteine 
kombiniert werden. Auf jeder Komplexitatsstuf e konnen 
Mutationen eingefiigt werden, die - ohne die globale Struktur 
zu verandern - eine Feinabstimmung der dreidimensionalen An- 
ordnung chemischer Gruppen erlauben. 

Figur 7 erlautert schematisch, daS verschiedene Proteine 
trotz unterschiedlicher , katalytisch aktiver Aminosauren im 
aktiven Zentrum in Bezug auf das Substrat homologe Funktionen 
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besitzen (Chymotrypsin/Trypsin) oder trotz ahnlicher raum- 
licher Anordnung der Aminosauren im aktiven Zentrum ganzlich 
unterschiedliche Reaktionen katalysieren (Trypsin/Elastase) 
konnen . 

Figur 8 erlautert den Zusammenhang der Begriffe Seguenzraum- 
Formenraum- Funk t ions raum . 

Fig. 9-11 

Oligomere oder Polymere werden durch matrizenabhangige , 
enzymatische oder chemische Synthase durch Verlangerung von 
stochastischen (randomisierten) oder ausgewahlten (kon- 
struierten) Primer-Molekiilen hergestellt. Die Primer konnen 
komplementar zu 1.) diskreten Sequenzen ausschlieSlich am 
Ende des ursprunglichen Matrizen-Molekiils (Figur S/lO) 
diskreten Sequenzen uberall im ursprunglichen Matrizen- 
Molekul sein (Figur 10/11) aus einer Mischung von Zufalls- 
seguenzen bestehen, die die Synthese je nach (teilweiser) 
Komplementaritat zuf allig an vielen Stellen beginnen lassen 
(Fig. 10) . 

Entweder die Primer oder, wie in der Figur gezeigt, auch die 
Matrizen-DNA konnen zur Vereinf achung spaterer Auf reinigungs- 
prozeduren biotinyliert sein. Dies wurde insbesondere bei 
der Strangtrennung (z. B. an Streptavidin-Dynabeads) zur 
Aufreinigung der verlangerten Primer giinstig sein. 

Fig. 12 

Statt normaler dNTPs (Desoxy-Nucleosidtriphosphate) werden 
insbesondere thio-NTPs eingesetzt . Kettenabbruchmolekiile 
konnen dann zum Beispiel normale ddNTPs (Didesoxy-Nucleosid- 
triphosphate) sein. Es ist bekannt , daS Phosphodiester- 
bindungen leicht durch Exonuclease III in 50 mM Tris/HCl, 
5 mM MgClj, bei pH 10,0 spezifisch in Minuten gespalten 
werden konnen. Thiophosphat-Bindungen werden dagegen nicht 
gespalten (Labeit et al . , DNA 5:173, 1986) . Auf diese Weise 
kann man nach Inaktivierung der Polymerase die Enden der 
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entstandenen Polymere durch enzymatisches Entfernen der 
ddNTPs "entschiitzen" . 

Fig. 13 

Die entstandenen und entschutzten Polymere konnen entweder 
thermisch Oder chemisch, z. B. mit NaOH, getrennt werden, 
wobei sich die Biotin-gekoppelten Molekule z. B. an 
Streptavidin-Dynabeads abtrennen lassen. Nach Einstellen 
physiologischer Bedingungen hybridisieren die entschutzten 
Polymere zu teilweise uberlappenden Duplices. 

Fig. 14 

PGR ohne Primer fiihrt zur eigentlichen (Re- ) Kombination der 
Polymere und zur weiteren Verlangerung derselben. Nachdem 
die teilweise uberlappenden Duplices vervollstandigt wurden, 
findet eine weitere PGR mit (endstandigen) Primern staat, 
die wieder Produkte der ursprunglichen Lange erzeugt . 
Darunter befinden sich auch solche Sequenzen, in denen 
mehrere Marker vereinigt, neu kombiniert sind. 

Der Sequenzraum ist durch die linearen Nachbarschaf ts- 
beziehungen der Polymer-Bauelemente einer Polymerstruktur 
definiert. Homologien beschreiben Ahnlichkeiten (in %) in 
der Abfolge der Bauelemente einer chemischen Stoffklasse. 
Je hoher der Verwandtschaf tsgrad zweier Sequenzen desto 
geringer der Abstand im Sequenzraum. 

a) ... AATAATGCGGAATATTAGGCCT . . . 

b) ... AATAAAAAGCAATATTAAGCCT . . . 

c) ... TTAGCTAGCGATGCGCGCCGGG . . . 

Zum Beispiel weisen die Sequenzen a) und b) eine erhebliche 
Homologie auf, wahrend Sequenz c) keinerlei Ahnlichkeiten 
mit a) und b) zeigt. 

Der Foirmenraum ist definiert durch die "raumlichen" Nach- 
bar rhaf tsbeziehungen der durch ihn reprasentierten Polymere. 
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Der Abstand zweier Sequenzen ist durch den Verwandtschaf ts- 
grad ihrer Strukturen bestimmt. Homologie bedeutet hier 
Ahnlichkeit der Gesamtstrukturen von Polymeren, die wiederum 
aus chemisch verkniipften Bauelementen bestehen, Im Formenraum 
benachbarte Molekiile konnen im Sequenzraum durchaus weit 
voneinander entfernt liegen und umgekehrt . [Analog s. o. : 
Struktur a) 3 alpha-Helices, Struktur b) 2 Alpha-Helices plus 
unstrukturierter Bereich mit endstandiger , kurzer Helix, c) 
antiparalleles beta-Faltblatt aus 4 Blattern] Der Funktionen- 
raum ist definiert durch die geometrische , dynamische und 
physikalisch/chemische Oberf lachenstruktur , die rait einem 
weiteren Molekiil in spezifische Wechselwirkung treten kann. 
Homologien beschreiben Ahnlichkeiten der Oberflachenstruktur 
und den damit verbundenen Wechselwirkungseigenschaf ten . 

Im folgenden werden lineare Kombinationen von Formencodes 
uber in vitro Rekombination von Formencodes aus naturlichen 
Oder in vitro hergestellten Muteinen beschrieben. 

Bei der linearen Kombination von Formencodes konnen hetero- 
loge wie auch zumindest teilweise homologe Formencodes 
verwendet werden. Sequenzhomologe Formencodes konnen zufallig 
in einer zu rekombinierenden Mischung vorhanden sein oder 
bewufit ausgewahlt werden. Diese Mischung kann beispielsweise, 
wie bei Eigen & Henco WO 92/18645 beschrieben, homolog 
auseinander hervorgegangene Mutantenkollektive einer Aus- 
gangssequenz , oder homologe Gene verwandter oder unterschied- 
licher Organismen enthalten. Dabei konnen ahnliche Sequenzen, 
z. B. bezuglich ihrer Funktionscodes , sehr unterschiedlich 
sein . 

Die Natur hat fiir ein und dieselbe oder sehr ahnliche 
Reaktionen, fiir verschiedene Wirtssystem ahnliche oder mole- 
kular unterschiedliche Enzyme evolviert, von denen angenommen 
werden kann, dafi sie fur die jeweilige Umgebung, fiir die sie 
angepaSt wurden, optimale Losungen bieten. Dafur ist die 
Penicillinacylase beispielhaf t . Dieses Enzym ist fiir die 
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industrielle Anwendung im Bereich der Synthese von zentraler 
Bedeutung. Vor einer Synthese halbsynthetischer Derivate des 
Penicillin-Grundkopers muS in natiirlicher Weise synthe- 
tisiertes Penicillin zunachst schonend einer Acylase-Reaktion 
unterworfen werden, bevor es in einer Umkehrung des Prozesses 
wiederum mit kunstlichen Derivaten reacyliert werden kann. 
Fur beide Reaktionen kann die Penicillinacylase eingesetzt 
werden. Fur diese Reaktion sind bestimmte Reaktions- 
bedingungen und Substrate erwiinscht . Diese Bedingungen 
unterscheiden sich jedoch von der in vivo Situation des 
Mikroorganismus, aus dem jeweils Penicillinacylasen isoliert 
wurden. Dies trifft zum Beispiel auf die optimale Lage des 
Gleichgewichtes fur das acylierte Syntheseprodukt oder fur 
die hydrolytische Spaltung zu. Es ist gewunscht, das Enzym 
bezogen auf die Umsatzzahl unter den industriell am besten 
geeigneten Bedingungen zu optimieren . 

Insbesondere kann von einem Gen einer bestimmten natiirlich 
vorkommenden Acylase ausgegangen und diese konsekutiven 
Mutations- und Selektionszyklen unterworfen werden. Wenn 
verschiedene, aktive Mutanten gefunden sind, lassen sich die 
als positiv selektierten unterschiedlichen Varianten bezogen 
auf die jeweils selektierten Punktmutationen liber Re~ 
kombination ein weiteres Mai durchmischen . Die so zu 
mischenden Varianten konnen wie in WO 92/18 64 5 beschrieben 
gewonnen werden. Die Natur verfiigt haufig bereits liber eine 
Kollektion von positiv selektierten Muteinen in Form der 
Enzymgene aus verschiedenen Mikroorganismen, die beispiels- 
weise den gewiinschten Reaktionstyp katalysieren. Von diesen 
Kollektionen ausgehend, lassen sich bereits Spektren rekombi- 
nierter Formencodes und Funktionscodes erzeugen, bevor 
eventuell wieder im weiteren Verlauf Mutations- oder eine 
Kombination von Mutations -/Rekombinationszyklen durchlauf en 
werden. Es ist durchaus vorteilhaft, am Anfang eines solchen 
Prozesses von moglichst umf angreichen Formencodes auszugehen, 
deren Mutationen sich in einem bestimmten Kontext des je- 
weiligen Gens als positiv oder neutral erwiesen haben. 
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Die in vitro-Rekombination wird dabei vorzugsweise nach zwei 
unterschiedlichen Strategien durchgef iihrt • 

Rekombination kann ein in der Regel unerwunschtes Neben- 
produkt einer Amplif ikationsreaktion im Sinne einer PCR- 
Reaktion sein. Wenn in der Sattigungsphase einer PCR-Reaktion 
nach dem Durchlaufen vieler Zyklen die Losung an Reagentien 
Oder Enzym verarmt und die Reaktion unterhalb des Km-Wertes 
fiir bestimmte Nucleotidtriphosphate verlauft, kommt es 
zwangslaufig zu nicht f ertiggestellten Syntheseprodukten . 
Solche Ereignisse sind als unerwtinschte Artefakte bereits 
von Simon Wain-Hobson diskutiert worden, um HIV-Varianten 
als mogliche Artefakte nach erfolgter PCR-Amplif ikation zu 
beschreiben. Dieser Effekt wird aber erf indungsgemafi einge- 
setzt und gesteuert, insbesondere noch verstarkt, daS wunsch- 
gemaS unvollstandig synthetisierte Produkte dominant werden. 
Wenn gleichzeitig die Primer- induzierte Neusynthese unvoll- 
standig erfolgt, hybridisieren malSgeblich unvollstandige 
Syntheseprodukte mit vollstandig oder ebenfalls xinvollstandig 
synthetisierten Gegenstrangen . Dabei kommt es zu molekularen 
Rekombinationsereignissen, bei denen verschiedene Gensegmente 
im Sinne einer Rekombination von Formencodes miteinander 
rekombiniert werden . 

Erf indungsgemaS laSt sich nach einer weiteren spezifischen 
Vorgehensweise die Rekombination wahrend und nicht nur nach 
einer PCR-Reaktion steuern. Hierbei werden der standard- 
maSigen PCR-Reaktion kurze Oligomere zugesetzt, die nur dann 
als PCR-Primer fungieren, wenn die Initiation der Synthese 
mittels thermostabiler Polymerase bei vergleichsweise tiefen 
Temperaturen erfolgt. Wann immer die korrekte PCR-Reaktion 
dominieren soli, wird ein normaler Temperaturzyklus ausge- 
fiihrt. Wenn es zu internen Startreaktionen kommen soil, 
werden einige Zyklen bei niedriger Temperatur initiiert, 
eventuell unter Zusatz von Polymerasen wie DNA- Polymerase 
I, wie sei bei Oligomer-gestarteten Markierungsreaktionen 
eingesetzt wird (Sambrook, Fritsch, Maniatis, "Molecular 
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cloning"). Die entstehenden unvollstandigen Sequenzen konnen 
sich bei weiteren Amplif ikationsrunden zusammenlagern, wobei 
die liberhangenden Enden jeweils am 3'-Ende aufgefiillt werden 
konnen. Bei diesen Reaktionen muB gemaS an sich bekannten 
Reassoziationskinetik von Nucleinsauren darauf geachtet 
werden, daS die fur eine Rekombination bestimmten Sequenzen 
in hinreichender Konzentration zur Verfugung stehen, urn in 
wenigen Sekunden bis Minuten die unvollstandig gepaarten 
Duplices auszubilden. Um zu vermeiden, daS bei der matrizen- 
vermittelten Neusynthese unerwunscht eine Strangverdrangung 
anstelle eines Rekombinationsereignisses stattfindet, werden 
insbesondere solche Polymerasen verwendet, die keine Strang- 
verdrangung induzieren oder keine 5' -3 ' -Exonucleaseaktivitat 
aufweisen. Stattdessen lassen sich bevorzugt thermostabile 
Ligasen einsetzen, so dafi Rekombinationsereignisse durch 
kovalente Verknupfung der Fragmente fixiert werden.. 

Im erf indungsgemafien Verfahren zur Rekombination von Formen- 
codes setzt man Elemente mit zumindest teilweisen Sequenz- 
homologien, wie sie oben beschrieben wurden, ein. Mit Hilfe 
matrizenabhangiger chemischer oder enzymatischer DNA- oder 
RNA-Synthese durch Verlangerung von erzeugten (randomi- 
sierten) Primern oder ausgewShlten (konstruierten) Primern 
wird eine Vielzahl von Fragmenten mindestens einer ursprung- 
lichen Sequenz erzeugt (s. Fig. 9 - 11) . Ausgewahlte Primer 
mit definierter Sequenz konnen dabei so posit ioniert werden, 
dafi bestimmte Bereiche der zu bearbeitenden DNA- ode rRNA- 
Molekiile, z. B. aktiven Zentren, Endonuclease-spezif ische 
Spaltstellen oder genregulatorische Elemente, vom Rekom- 
binationsprozeE ausgeschlossen sind und somit unverandert 
erhalten bleiben, Der Einsatz teilweise randomisierter Primer 
in Bereichen (partieller) Komplementaritat analog Mutagani- 
sierungs- Primern, kann dazu verwendet werden, zusStzlich eine 
erhohte Mutationsrate einzufiihren. Durch den Einsatz einer 
kleinen, subinhibitorischen Menge von Kettenabbruchmonomeren, 
in der DNA-Synthese von vorzugsweise Dideoxynucleotiden, wird 
ein zufalliger Abbruch der Verlangerungsreaktion und damit 
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eine Langenvarianz der synthetisierten Polymere erreicht. 
Mittels des Verhaltnisses der Konzentration des Abbruch- 
reagenz zu den Konzentrationen der Nucleotidmonomeren laSt 
sich wie bei einer Sequenzierungsreaktion die durchschnitt- 
liche Kettenlange des Syntheseproduktes steuern. Nach Ab- 
trennung des polymerisierenden Agenz, beispielsweise einer 
Inaktivierung des Enzyms, kann die endstandige Schutzgruppe, 
d. h. das Kettenabbruchmonomer ganz oder teilweise wieder 
abgespalten werden, damit die entstehenden Polymere wieder 
gute Substrate fur die Verlangernangsreaktion sind (Fig. 12) . 
Die so entschiitzten DNA- oder RNA- Polymere werden dann 
mindestens einem Zyklus aus Denaturierung/Hybridisierung 
teilweise komplementarer Strange gefolgt von einer Auf full- 
reaktion unterzogen. Am SchluS des Verfahrens wird das 
entstandene Gemisch verlangerter Polymere einer Polymerase- 
Kettenreaktion unterzogen, wobei die Primer vorzugsweise 
komplementar zu den Enden der urspriinglich eingesetzten 
Sequenz liegen sollten. Auf diese Weise entstehen wieder 
Produkte der ursprunglichen Lange. Diese enthalten jetzt aber 
Kombinationen von Sequenzabschnitten verschiedener vorteil- 
hafter, bereits selektierter , einzelner Punktionmutationen 
in sehr effizienter Weise zu kombinieren, statt sie 
sequentiell in einem stochastischen ProzeS erst erzeugen zu 
mils sen 



wo 95/17413 



- 23 - 



PCT/EP94/04240 



Anspruche 

1. Verfahren zur Herstellung oligomerer oder polymerer Funktion- 
selemente aus Formenelementen, wobei die Funktionselemente 
erhaltlich sind durch Verknupfung von mindestens zwei Formen- 
elementen, von denen mindestens ein Formenelement selbst aus 
mindestens zwei Monomeren aufgebaut ist, die durch mindestens 
eine chemische Bindung verknupft sind, die der chemischen 
Bindung zwischen zwei Formenelementen entspricht . 

2. Verfahren gemaS Anspruch 1, wobei die Verknupfung der Formen* 
elemente unter Einsatz einer f esten Phase als Reaktionstrager 
durchgefiihrt wird. 

3. Verfahren gemaS Anspruch 1 und/oder 2, wobei die Verknupfung 
der Formenelemente chemisch und/oder enzymatisch erf olgt . 

4 . Verfahren gemaS mindestens einem der Anspruche 1 - 3 , wobei 
die Verknupfung von Formenelementen zu Funktionselementen 
planmafiig und/oder stochastisch erf olgt . 

5. Verfahren gemaS mindestens einem der Anspruche 1-4, wobei 
die Verknupfung schrittweise aufbauend, stereospezif isch 
und/oder gerichtet erf olgt . 

6. Verfahren gemaS mindestens einem der Anspruche 1 bis 5, 
dadurch gekennzeichnet , daS die Formenelemente zur Stoff- 
klasse der Nucleinsauren, doppelstrangiger und/oder einzel- 
strangiger DNA und/oder RNA und/oder modif izierten Nuclein- 
sauren und/oder Peptiden und/oder Polypeptiden gehoren 
und/oder aus sonstigen kopplungsf ahigen chemischen Oligomer-- 
Formenelementen aufgebaut sind. 

7. Verfahren gemSS mindestens einem der Anspruche 1-6, dadurch 
gekennzeichnet , daS die Formenelemente als bereits synthe- 
tisierte Oligomer-Bausteine eingesetzt werden oder zunfichst 
im Reaktionsgef aS generiert werden. 
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8. Verfahren gemaS mindestens einem der Anspriiche 1-7, dadurch 
gekennzeichnet , daS die Reaktionen in parallel gefuhrten 
Micro-Reaktionsansatzen durchgef lihrt werden, bei denen 
Formenelemente in vorbestimmter Reihenfolge verknupft werden, 

9. Verfahren gemaS mindestens einem der Anspriiche 1-8, dadurch 
gekennzeichnet , daS nach erfolgter Synthese die Reaktions- 
produkte, wie Funktionselemente oder Vorstufen davon fest- 
phasengekoppelt bleiben oder in die losliche Phase entkoppelt 
werden. 

10. Verfahren nach Anspruch 9, wobei die Reaktionsprodukte mit 
einem biologischen Test system vereinigt werden, wobei die 
Funktion im gleichen Volumenelement wie die Synthese be- 
wertend gemessen wird, z.B, durch den Einsatz der FCS-- 
Analysetechnik , 

11. Verfahren gemaS mindestens einem der Anspruche 1-10, 
dadurch gekennzeichnet, daE pro Reaktionsschritt bei der 
schrittweisen Verknupfung der Formenelemente jeweils ein 
Formenelement als Reaktionspartner an fester Phase gekoppelt 
ist . 

12. Verfahren gemaS mindestens einem der Anspruche 1 - 11, 
dadurch gekennzeichnet, dafi Mischungen von Formenelement en 
eingesetzt werden und/oder generiert werden konnen. 

13. Verfahren gemaS mindestens einem der Anspruche 1 - 12, 
dadurch gekennzeichnet, daS im Falle des Aufbaues von 
Nucleinsaure- Formenelement en und/oder der Verknupfung von 
Nucleinsaure- Formenelement en wenigstens ein Reaktionspartner 
eine Schnittstelle fiir ein Restriktionsenzym enthalt und/oder 
frei von Start- und/ oder Stopcodons ist, 

14 . Verfahren gemaS mindestens einem der Anspruche 1 - 13 , 
dadurch gekennzeichnet, dafi liber die Einfuhrung von Restrik- 
tionsschnittstellen, insbesondere solchen fiir Enzyme der 
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Klasse IIS beliebige Sequenzen gerichtet verkniipft werden 
konnen, ohne daB Sequenzerf ordernisse des erwunschten Endpro- 
duktes die Wahl des Reaktionsenzyms beeinflufien. 

15. Verfahren gemaS mindestens einem der Anspriiche 1 -14, 
dadurch gekennzeichnet , daS uber die Einfuhrung von einzelst- 
rangigen Uberhangen und/oder selektive und reversible 
chemische und/oder enzymatische Modifikation der 3'-Enden 
und/oder der 5'-Enden der Nucleinsauren, zum Beispiel 
Phosphorylierung, beliebige Sequenzen gerichtet verkniipft 
werden konnen, ohne daS dabei irgendwelche Anf orderungen an 
die Seguenz des erwunschten Endproduktes entstehen. 

16. Verfahren gemaS mindestens einem der Anspriiche 1-15, 
dadurch gekennzeichnet , daS Formenelemente nach dem Vorbild 
rontgenkristallografisch analysierter natiirlicher Proteine 
Oder Polypeptide eingesetzt werden. 

17. Verfahren gemaS mindestens einem der Anspriiche 1 - 16, 
dadurch gekennzeichnet, daS mindestens eines der verwendeten 
Formenelemente aus Selektionsexperimenten stammt . 

18. Verfahren gemafi mindestens einem der Anspriiche 1 - 17, 
dadurch gekennzeichnet, daB die Formenelemente zwischen 1 
und 60 Aminosauren enthalten oder Nucleotide entsprechender 
Kodierungslange . 

19. Verfahren gemaS mindestens einem der Anspriiche 1 - 18, 
dadurch gekennzeichnet, dafi Formenelemente eingesetzt werden, 
die an bestimmten Positionen degeneriert sind und/oder 
Deletionen oder Insert ionen tragen. 

20. Verfahren gemafi einem der Anspruche 1 bis 19, dadurch gekenn- 
zeichnet, daB die Funktions- und/oder Formenelemente bzw. 
Funktionscodes und/oder Formencodes als Oligo- oder Poly- 
nucleotide niedergelegt sind, die erhaltlich sind 
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durch Generierung aus Algorithmen, insbesondere evo- 
lutiver Algorithmen, 

durch Ubernahme oder Modif izierung natiirlich vorkommen- 
der Nucleinsauren und/oder, 

Generierung mittels de novo Synthese von Oligo-/Poly- 
nucleotiden durch matrizenabhangige oder -unabhangige 
Reaktionen von Polymerasen mit Nucleotiden. 

21. Verwendung des Verfahrens gemafi mindestens einem der 
Anspriiche 1-20 zur Synthese parallel aufgebauter Formen- 
Bibliotheken funktionaler Oligomere oder Polymere. 
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Chymotrypsin 



homolog 



Gty 226 



Ser 189 



nicht homoiog 





Trypsin 



Gly 226 



Asp 1 89 



Val 226 



riGUR 7 
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Sequenzraum - Formenraum - Funktionsraurr 



Der Sequenzraum ist durch die linearen 
Nachbarschaftsbeziehungen einer 

Polymerstruktur definiert. 

Homologien beschreiben Ahnlichkeiten (in %) in 

der Abf olge der Bauelemente einer chemischen 

Stoffklasse. 




Der Formenraum ist definiert durch die 
raumlichen Nachbarschaftsbeziehungen der 
Bausteine einer Polymerstruktur. 
Homologien beschreiben Ahnlichkeiten der 
Raumstruktur von nicht unmittelbar chemisch 
verknupften Bauelementen. 




Der Funktionenraum ist definiert durch die 
geometrische, dynamische und 
physikalisch/chemische Oberflachenstmktur. die 
mit einem weiteren Molekul in spezifische 
Interaktion treten kann, 
Homologien beschreiben Ahnlichkeiten der 
Oberflachenstnjktur und den damit verbundenen 
Wechseiwirkungseigenschaften. 
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Figur 9 
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nicht exakt komplementare Bereiche 
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Figur 11 
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Strangtrennung 
Aufreinigung 



Uberstand 



Streptavidin-Dynabeads mit 
Matritzenstrang im Niederschlag 




magnet Dynabead 



Figur 13 
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PCR ohne Primer 



Figur 14 
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